Lecture 12
检测evolution stable例子
收益矩阵:
a | b | |
---|---|---|
a | 1, 1 | 1, 1 |
b | 1, 1 | 0, 0 |
(a, a)是其中的一个纳什均衡点,但是并不是strict NE,因此a并不是evolution stable策略。
u(a, a) = u(b, a) = 1
下一步,我们验证u(a, b) = 1和u(b, b) = 0的大小关系,发现u(a, b)>u(b, b)因此a是evolution stable的。
Evolution of social convention: drving on the left or right
L | R | |
---|---|---|
L | 2, 2 | 0, 0 |
R | 0, 0 | 1, 1 |
(L, L) (R, R)都是strict 纳什均衡的,因此都是evolution stable。
lesson:
从上面开车的结果来看,社会上可以存在着多种的evolution stable。并不一定需要效率最高。
另一个例子:
a | b | |
---|---|---|
a | 0, 0 | 2, 1 |
b | 1, 2 | 0, 0 |
该博弈赋予的含义:两个车相向而行,a表示暴力往前开,b表示掉头开。
(a, b)和(b, a)都是纳什均衡点,但是他们是不对称的(我们之前的所有有关evolution stable的研究都是对称博弈)。
没有一个纯的策略,使得该策略在整个族群中稳定的保存。因此我们必须开始考虑混合策略了(mixed strategy)。
在lecture 10有关约会的例子中,NE = [(2/3, 1/3), (1/3, 2/3)]是一种混合策略的纳什均衡。
在这个例子中,也就是一个种群中,有2/3的生物是好斗的,而1/3的生物是温顺的。
实际上,在自然界中确实存在多样的选择,也就是生物的多态性,这就是为什么我们接下来讨论mixed strategy 是合理的。
有趣的例子:SLF:sneaky little fucker
definition of mixed strategy in evolution
在混合纳什均衡中,他们的值不是严格最大的。因为不论怎么偏移两种选择之间的概率,他们的混合策略期望都是不变的。
正是有了这一条,我们在lecture 11最后的关于evolution stable的第二个定义中,我们需要验证。(因为第一个验证条件必定是满足的)
例子: 鹰鸽之争
H | D | |
---|---|---|
H | v, 0 | |
D | 0, v |
prize = v > 0
costs of fight = c > 0
is D evolution stable strategy(ESS)?
首先我们要搞明白(D, D)是否是纳什均衡的的?并不是的。
那么(H, H)是ESS吗?
如果,那么(H, H)就是纳什均衡的。
如果,那么(H, H)就是严格纳什均衡的。那么此刻肯定是ESS。
下面讨论v = c的情况:
重要:
回顾一下u(D, H)的含义:这个值表示这个策略组合的期望,并且主角应该是使用了H的,入侵者是D。
玩家1使用了D,玩家2使用了H,计算玩家1的期望。
表示玩家2使用了组合策略(H, D),并且概率是,因此计算方法为.
后面有关于鹰和鸽子的例题就是很好的例子。
也就是u(H, H) = u(D, H) = 0 (Dove进来没有用)
并且u(H, D) = v > u(D, D) = (有利的方向朝着Hawk不断进行发展)
综上,H是ESS。
如果呢?
我们知道H不是ESS
D不是ESS
那么混合 情况下呢?
H | D | ||
---|---|---|---|
H | v, 0 | ||
D | 0, v | ||
首先找到混合策略的纳什均衡点:
纯使用H的期望:
纯使用D的期望:
令两者相等:
因此NE =
混合的策略都不是strict NE。
因此我们要检查,对任意的都成立
带入上面的值,因此鸽派的混合收益为
lesson:
如果那么老鹰的比例为:
a) 当v增加的时候,斗争的利益放大,在ESS中老鹰的比例更大。
同理,当c增加的时候,鸽子的比例更大。
b)
当c增加的时候,payoffs是增加的!斗争看来是不好的。
c) 验证:在实际的实验中,我们能够统计出的值。
上面的例子主要就是为了讲mixed strategy在evolution stable strategy中的应用。
剪刀石头布在自然界中的应用
通过验证剪刀石头布在NE的情况下,并不存在ESS状态。
会进行一个此消彼长的循环状态。